단백질 패밀리

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요
2. 용어 및 정의
3. 단백질 도메인 및 모티프
4. 단백질 패밀리의 진화
5. 단백질 패밀리의 활용 및 중요성
6. 단백질 패밀리 관련 자료
참조

1. 개요

단백질 패밀리는 서열, 기능, 구조가 유사한 단백질의 집합을 의미하며, 단백질 슈퍼패밀리, 단백질 서브패밀리 등 계층적 분류 체계를 갖는다. 단백질 도메인과 모티프는 단백질 패밀리를 이해하는 데 중요한 개념이며, 단백질 패밀리는 유전자 중복과 돌연변이 과정을 통해 진화한다. 단백질 패밀리는 계통 발생 분석, 기능 주석, 효소 기능 연구 등에 활용되며, Pfam, PROSITE, InterPro 등 다양한 데이터베이스와 검색 알고리즘을 통해 정보를 얻을 수 있다.

더 읽어볼만한 페이지

단백질의 분류 - 단백질 슈퍼패밀리
단백질 슈퍼패밀리는 서열, 구조, 메커니즘의 유사성을 기반으로 식별되는 진화적으로 관련된 단백질 그룹이며, 공통 조상을 식별하는 데 중요한 자료가 된다.
단백질의 분류 - 수송체 분류 데이터베이스
수송체 분류 데이터베이스는 이온 통로, 포린, 기공 형성 독소 등 다양한 수송체들을 기능, 구조, 작용 기전 등에 따라 분류하는 데이터베이스이며, 이러한 수송체들은 생명체의 생존과 기능 유지에 필수적인 역할을 수행하여 질병 치료 및 예방 전략 개발에 기여한다.
단백질 슈퍼패밀리 - 글로빈
글로빈은 글로빈 슈퍼패밀리에 속하는 단백질로, 8개의 α 나선으로 구성된 '글로빈 폴드'라는 3차원 구조를 가지며, 헤모글로빈, 미오글로빈 등 다양한 종류가 존재하고 산소 운반, 저장, 센서 기능 등을 수행하며, 공통 조상으로부터 진화하여 M/F, S, T 세 가지 주요 계열로 나뉜다.
단백질 슈퍼패밀리 - 미오신
미오신은 액틴 필라멘트를 따라 움직이며 힘을 생성하는 단백질 분자로, 근육 수축, 세포 운동, 소포 수송 등 다양한 생체 내 기능에 관여하며, 근육형, 비근육형, 프로세시브형, 논프로세시브형으로 분류된다.
패밀리 단백질 - 단백질 도메인
단백질 도메인은 폴리펩타이드 사슬 내에서 독립적인 기능을 수행하며, 단백질의 3차원 구조를 이루는 기본 단위로서 기능, 진화, 단백질 접힘에 중요한 역할을 하는 공통적인 구조적 요소이다.
패밀리 단백질 - 전사인자
전사 인자는 DNA 특정 서열에 결합하여 유전자 발현을 조절하는 단백질로서, RNA 중합효소와 함께 전사를 조절하여 유전 정보 전달에 핵심적인 역할을 하며, 발생, 신호 전달, 환경 반응, 세포 주기 조절 등 다양한 생물학적 과정에 관여한다.

2. 용어 및 정의

단백질 패밀리라는 용어는 광범위하게 사용되며, 거의 감지할 수 없는 서열 유사성을 가진 단백질의 큰 그룹뿐만 아니라, 거의 동일한 서열, 기능 및 구조를 가진 좁은 그룹의 단백질에도 적용될 수 있다. 이러한 경우를 구별하기 위해 계층적 용어가 사용된다. 분류의 최상위 수준에는 종종 구조적 유사성을 기반으로 하여, 서로 먼 관계의 단백질을 묶는 단백질 슈퍼패밀리가 있다.^[6]^[7]^[8]^[9] 다음은 상당한 서열 유사성을 통해 나타나는 공통적인 진화적 기원을 가진 단백질을 나타내는 단백질 패밀리이다.^[2]^[10] 단백질 서브패밀리는 유사하거나 동일한 기능을 가진 밀접하게 관련된 단백질을 나타내기 위해 패밀리 내에서 정의될 수 있다.^[11] 예를 들어, PA 클랜 프로테아제와 같은 슈퍼패밀리는 그 안에 있는 C04 패밀리보다 서열 보존성이 떨어진다.

3. 단백질 도메인 및 모티프

단백질 패밀리는 초기에 미오글로빈, 헤모글로빈과 같이 하나의 도메인으로 구성된 단백질을 중심으로 인식되었다. 이후, 여러 개의 독립적인 구조 및 기능 단위(단백질 도메인)를 가진 단백질이 발견되면서, 단백질 도메인 패밀리에 대한 연구가 활발해졌다. 진화 과정에서 재조합으로 인해 단백질 내 도메인은 독립적으로 진화하여, 단백질 도메인 패밀리가 형성되었다. 여러 온라인 리소스에서 이러한 단백질 도메인을 식별하고 분류하는 정보를 제공한다.^[12]^[13]

단백질의 기능적 제약은 영역마다 다르다. 예를 들어, 효소의 활성 부위는 특정 아미노산 잔기가 정확하게 정렬되어야 한다. 단백질-단백질 결합 인터페이스는 아미노산 잔기의 소수성 또는 극성에 제약이 있는 큰 표면으로 구성될 수 있다. 기능적으로 제약된 영역은 제약이 없는 영역보다 느리게 진화하여 보존된 서열 블록(모티프)을 생성한다. 여러 온라인 리소스에서 이러한 단백질 모티프를 식별하고 분류하는 정보를 제공한다.^[14]

4. 단백질 패밀리의 진화

현재 합의에 따르면, 단백질 패밀리는 두 가지 방식으로 발생한다. 첫째, 부모 종이 유전적으로 고립된 두 개의 자손 종으로 분리되면 유전자/단백질이 이 두 계통에서 독립적으로 변이(돌연변이)를 축적할 수 있다. 이것은 일반적으로 보존된 서열 모티프를 가진 오르톨로그 단백질 패밀리를 생성한다. 둘째, 유전자 중복은 유전자의 두 번째 사본(파랄로그라고 함)을 생성할 수 있다. 원래 유전자가 여전히 기능을 수행할 수 있기 때문에 중복된 유전자는 자유롭게 분화되어 (무작위 돌연변이에 의해) 새로운 기능을 획득할 수 있다.^[15]

특정 유전자/단백질 패밀리, 특히 진핵생물의 경우, 진화 과정에서 극심한 확장과 수축을 겪으며, 때로는 전체 게놈 중복과 함께 발생한다. 확장 가능성은 낮고 손실 가능성은 내재적으로 무질서한 단백질과 소수성 아미노산이 1차 서열을 따라 최적 분산 정도에서 더 멀리 떨어진 단백질 도메인에서 더 높다. 단백질 패밀리의 이러한 확장과 수축은 게놈 진화의 두드러진 특징 중 하나이지만, 그 중요성과 결과는 현재 불분명하다.^[15]

RAS 슈퍼패밀리의 계통 발생 나무: 이 나무는 FigTree (무료 온라인 소프트웨어)를 사용하여 만들었습니다.

5. 단백질 패밀리의 활용 및 중요성

단백질 서열 수 증가와 프로테옴 분석에 대한 관심 확대로 단백질을 패밀리로 구성하고 구성 요소인 도메인과 모티프를 설명하려는 연구가 진행 중이다. 단백질 패밀리의 신뢰성 있는 식별은 계통 발생 분석, 기능 주석, 단백질 기능 다양성 탐구에 매우 중요하다.^[16] 효소 기능 이니셔티브(Enzyme Function Initiative)는 서열/구조 기반 전략 개발의 기초로 단백질 패밀리 및 슈퍼패밀리를 활용한다.^[16] 대규모 단백질 패밀리 구축을 위한 알고리즘은 유사성 개념에 기반한다.

6. 단백질 패밀리 관련 자료

많은 생물학 데이터베이스에서 단백질 패밀리 목록을 제공하고 사용자가 쿼리 시퀀스를 알려진 패밀리에 일치시킬 수 있도록 한다.^[1] 여기에는 다음이 포함된다.^[1]

마찬가지로 많은 데이터베이스 검색 알고리즘이 존재한다.^[1] 예를 들면 다음과 같다.^[1]

참조

_[1] 웹사이트 What are protein families? Protein classification https://www.ebi.ac.u[...] 2023-11-14
_[2] 서적 Protein Families: Relating Protein Sequence, Structure, and Function John Wiley & Sons, Inc.
_[3] 논문 An Introduction to Sequence Similarity ("Homology") Searching 2013
_[4] 논문 A comprehensive review and comparison of different computational methods for protein remote homology detection https://pubmed.ncbi.[...] 2018-03-01
_[5] 논문 Myriads of protein families, and still counting 2003
_[6] 논문 Computer analysis of protein sequences 1974-12
_[7] 논문 Evolution of sequences within protein superfamilies
_[8] 논문 The origin and evolution of protein superfamilies 1976-08
_[9] 논문 Protein Families and Their Evolution—A Structural Perspective https://www.annualre[...] 2005-06-01
_[10] 논문 Visualizing Sequence Similarity of Protein Families 2004
_[11] 서적 Protein Families: Relating Protein Sequence, Structure, and Function John Wiley & Sons, Inc.
_[12] 논문 Protein domain identification methods and online resources 2021-01-01
_[13] 서적 Protein Families: Relating Protein Sequence, Structure, and Function John Wiley & Sons, Inc.
_[14] 논문 Tools and resources for identifying protein families, domains and motifs 2001-12-19
_[15] 논문 Differential Retention of Pfam Domains Contributes to Long-term Evolutionary Trends 2023-04-04
_[16] 논문 The Enzyme Function Initiative 2011-11-22
_[17] 논문 PASS2 version 4: An update to the database of structure-based sequence alignments of structural domain superfamilies https://doi.org/10.1[...] 2012
_[18] 논문 OrthoFinder: Solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy 2015-08-06
_[19] 논문 OrthoFinder: Phylogenetic orthology inference for comparative genomics 2019-11-14

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com

단백질 패밀리
단백질 패밀리 개요
정의	진화적으로 관련된 단백질 그룹
특징	유사한 서열 유사한 3차원 구조 유사한 기능
관련 개념	유전자 패밀리 단백질 도메인 단백질 모티프
단백질 패밀리 분류 방법
서열 유사성 기반	전체 아미노산 서열 비교
구조 유사성 기반	3차원 구조 비교
기능 유사성 기반	생화학적 기능 비교
진화 관계 기반	공통 조상으로부터의 진화 경로 추적
단백질 패밀리 데이터베이스
주요 데이터베이스	Pfam InterPro প্রোसाइट SCOP CATH
데이터베이스 활용	단백질 기능 예측, 진화 관계 연구, 약물 표적 발굴 등
단백질 패밀리의 중요성
생물학적 중요성	세포 내 다양한 생명 현상 조절 생체 내 물질대사 과정 촉매 외부 자극에 대한 신호 전달
의학적 중요성	질병 진단 및 치료, 신약 개발 등에 활용
관련 연구 분야
연구 분야	생물정보학 구조생물학 유전체학 단백질체학

데이터베이스 이름	설명
Pfam	정렬 및 HMM의 단백질 패밀리 데이터베이스^[1]
PROSITE	단백질 도메인, 패밀리 및 기능적 부위 데이터베이스^[1]
PIRSF	슈퍼패밀리 분류 시스템^[1]
PASS2	단백질 정렬 as 구조적 슈퍼패밀리 v2 - PASS2@NCBS^[1]
SUPERFAMILY	모든 완전하게 시퀀싱된 유기체에 대한 슈퍼패밀리를 나타내는 HMM 라이브러리 및 (슈퍼패밀리 및 패밀리) 주석 데이터베이스^[1]
SCOP 및 CATH	단백질 구조를 슈퍼패밀리, 패밀리 및 도메인으로 분류^[1]

알고리즘 이름	설명
BLAST	DNA 서열 유사성 검색^[1]
BLASTp	단백질 서열 유사성 검색^[1]
OrthoFinder	단백질을 패밀리(orthogroup)로 클러스터링하는 방법^[1]